Apprentissage discriminant de modèles neuronaux pour la traduction automatique

نویسندگان

  • Quoc-Khanh Do
  • Alexandre Allauzen
  • François Yvon
چکیده

RÉSUMÉ. Les méthodes utilisées pour entraîner des réseaux de neurones en traitement des langues reposent, pour la plupart, sur l’optimisation de critères qui sont décorrélés de l’application finale. Nous proposons un nouveau cadre d’apprentissage discriminant pour l’estimation des modèles neuronaux en traduction automatique. Ce cadre s’appuie sur la définition d’un critère d’apprentissage qui prend en compte, d’une part, la métrique utilisée pour l’évaluation automatique de la traduction et, d’autre part, le processus d’intégration de ces modèles au sein des systèmes de traduction automatique. Cette méthode est comparée aux critères d’apprentissage usuels que sont le maximum de vraisemblance et l’estimation contrastive bruitée. Les expériences menées sur les tâches de traduction des séminaires TED Talks et de textes médicaux, depuis l’anglais vers le français, montrent la pertinence d’un cadre d’apprentissage discriminant et l’importance d’une initialisation judicieuse, en particulier dans une perspective d’adaptation au domaine.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Continuous space models with neural networks in natural language processing. (Modèles neuronaux pour la modélisation statistique de la langue)

Les modèles de langage ont pour but de caractériser et d’évaluer la qualité des énoncés en langue naturelle. Leur rôle est fondamentale dans de nombreux cadres d’application comme la reconnaissance automatique de la parole, la traduction automatique, l’extraction et la recherche d’information. La modélisation actuellement état de l’art est la modélisation "historique" dite n-gramme associée à d...

متن کامل

Traduction automatique de termes biomédicaux pour la recherche d'information interlingue

RÉSUMÉ. Dans cet article, nous présentons une méthode de traduction automatique de termes biomédicaux. Cette méthode s’appuie sur une technique originale d’apprentissage supervisé de règles de réécriture et sur l’utilisation de modèles de langue. Les évaluations présentées montrent que notre technique est très performante et permet de traduire à partir et à destination de n’importe quelle langu...

متن کامل

Sélection topologique de variables dans un contexte de discrimination

Résumé. En apprentissage automatique, la présence d’un grand nombre de variables explicatives conduit à une plus grande complexité des algorithmes et à une forte dégradation des performances des modèles de prédiction. Pour cela, une sélection d’un sous-ensemble optimal discriminant de ces variables s’avère nécessaire. Dans cet article, une approche topologique est proposée pour la sélection de ...

متن کامل

Algorithmes de Generation automatique Experience de Generation des Phrases simples du Francais

Dans ce travail on expose un algorithme i de g~n~ration automatique, dont le but est: A ) De connaltre la capacit~ g~n~rative de la syntaxe obtenue dans l'exp6rience d'apprentissage automatique d~crite ~ afro d'~valuer son degr~ d'~labortion par rapport ~t la langue en gdndral. B) De construire certaines &apes importantes de l'automatisation des processus de traduction. C) De construire tin sys...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 57  شماره 

صفحات  -

تاریخ انتشار 2016